摘要。大规模基因组或转录组数据上的机器学习对于许多新型健康应用都很重要。例如,根据单个生物标志物,细胞和分子状态等,塞维医学对患者的医疗治疗量身定制医疗治疗。但是,所需的数据是敏感的,大量的,异质的,通常在没有专用的机器学习硬件的位置分开。由于隐私和监管原因,在受信任的第三方中汇总所有数据也是问题。联合学习是解决这一难题的有前途的解决方案,因为它可以在不交换原始数据的情况下进行分散的,协作的机器学习。在本文中,我们对联合学习框架的张力和花朵进行了比较实验。我们的测试案例是疾病预后和细胞类型分类模型的培训。我们考虑了数据异质性和架构异质性。我们衡量模型质量,对增强隐私噪声的鲁棒性,计算性和资源开销。每个联合学习框架的工作都有不同的优势。但是,我们的实验证实,这两个框架都可以在转录组数据上很容易地构建模型,并且将个人原始数据传输到具有丰富的综合资源的第三方。
主要关键词